何时(不)该使用概率
When (Not) to Use Probabilities
❦
有些读者也许会惊讶:我并不总是主张使用概率。
更准确地说,我并不总是主张:人们在试图解决问题时,应该先试着编造出一套口头概率,再把概率论或决策理论的定律套用到自己刚编出来的那个数字上,最后把算出来的结果当成自己的最终信念或决策。
概率论的定律是定律,不是建议,但很多时候,真正的定律对我们人类来说太难计算。如果 P ≠ NP,而宇宙里又不存在指数级计算能力的来源,那么即便是超级智能,也会有一些证据更新根本算不出来——尽管只要我们付得起计算代价,那些概率本身其实定义得相当明确。
所以,有时你就是不会去应用概率论。尤其当你是人类,而你的大脑在进化中已经长出了各种处理不确定性推理的有用算法,而这些算法并不依赖口头概率赋值的时候。
不确定一只飞来的球会落在哪里?我不建议你试着为它的落点构造一个概率分布,对你瞥向球体的每一次观察都做刻意的贝叶斯更新,再去计算发给肌肉的所有可能运动指令序列的期望效用。要接住一只飞来的球,你大概还是依靠大脑内建的机制,比起诉诸审慎的口头推理去发明或操弄概率,要强得多。
但这并不意味着你是在超越概率论,或凌驾于概率论之上。
荷兰书论证依然适用。如果我给你一组赌局供你选择(比如:球落在这个方格里就给你 $10,000,或者我掷骰子掷出 6 就给你 $10,000),而你的回答无法对应到一组一致的概率,那么你就会接受那些必亏无疑的赌局组合,或者拒绝那些稳赚不赔的赌局……
但这仍不意味着你应该试图用审慎的口头推理来思考。至少对职业棒球选手来说,我会认为接住球比给出一致概率更重要。事实上,如果你硬要编造概率,那些口头上的概率,甚至未必比某种直觉层面的感觉更好——那是一种潜伏在你心智深处、无言地表征不确定性的东西。
除非你大脑里负责语言的那部分在这个问题上确实碰巧更好使,否则,用语言表达出来的不确定性并没有什么天然特权。
而且,虽然同一片疆域上的准确地图彼此之间必然相互一致,但并不是所有一致的地图都准确。准确比一致更重要,接住球也比保持一致更重要。
事实上,除非你看起来确实有某种像样的依据,否则我一般不建议你编造概率。这只会骗得你自己相信:你比实际情况更像一个贝叶斯主义者。
说得更具体些,在大多数情况下,我都不建议你用非数值程序去制造看上去像数值概率的东西。数字应该来自数字。
当然,试着把你对不确定性的直觉感受翻译成口头概率,也确实有其好处。这也许能帮助你发现像合取谬误这样的问题;也许能帮助你发现内在的不一致——尽管它未必会告诉你该如何补救。
但你不该四处以为:只要你把自己的直觉感受翻译成「千分之一」,那么每当你说出这几个字时,对应事件就会大约每一千次发生一次。你的大脑没校准得那么好。相反,如果你用某种非语言方式来处理自己对不确定性的直觉感受,你也许反而会做得更好,因为至少你是在按照它本来该被使用的方式去使用这种直觉感受。
最近,这个具体话题在大型强子对撞机(Large Hadron Collider,LHC)的语境下又冒了出来:有人在全球灾难性风险会议上提出了一项论证:
我们无法确定那些从多个角度论证 LHC 不可能毁灭世界的论文里没有错误。而且,论文使用的理论也可能是错的。无论是哪种情况,LHC 都有可能毁灭世界。所以,它就不该被启动。
如果这个论证仅仅是以这种方式提出,我并不会反对它的认识论。
但这位发言者实际上声称:LHC 那篇论文中的理论、模型或计算出错的概率至少有 1/1,000;而且,如果理论、模型或计算真的错了,那么 LHC 会毁灭世界的概率至少也有 1/1,000。
毕竟,未来几代人否定 LHC 论文所用理论、否定其模型,或者哪怕只是找出一个错误,这事想来也没那么不可思议。而如果 LHC 论文是错的,那谁知道还会发生什么呢?
所以,这的确是一条论证——但要给它赋上数字?
我反对的是,这些凭空扯出来的数字被赋予了一种权威感。我的一般看法是:如果你没法用概率工具来塑造自己对不确定性的感觉,那你就不该抬举它们,把它们叫作概率。
在这个具体案例里,我提出的替代做法是:讨论禁止物理实验的一般规则,因为你永远无法对那些宣称它们安全的论证抱有绝对确定性。
我认为,如果你这样来表述,你的心智在考虑事件频率时,就更可能把这个决定的更多后果带进来,也更可能想起更多相关的历史案例。
如果你只讨论 LHC 这一个案例,并给出具体概率,那么它就会:(1) 让非常摇摇欲坠的推理平白带上一层权威感,(2) 遮蔽把类似规则推广应用时的一般后果,甚至 (3) 造成一种错觉,仿佛只要别的人再发表一篇新物理论文,把这些概率压低一点,我们就可能作出不同的决定。
全球灾难性风险会议上的那些作者似乎在暗示:我们只要再多分析一点 LHC,然后就可以把它启动。这在我看来是整套论证里最虚伪的一部分。一旦你承认了「也许分析可能是错的,而那之后谁知道会发生什么」这种论证,就不存在任何一篇物理论文能够把它真正消除。
不管此前还发表过哪些其他物理论文,那些作者在全球灾难性风险会议上都会搬出同样的论证,并编出同样的数值概率。当然,我也不能确定这句话,但我给它的概率是 75%。
一般来说,一个理性主义者会努力让自己的心智以可达到的最佳功率运转;有时这意味着要谈论口头概率,有时则不意味着,但概率论的定律始终都在支配。
如果你手头只有一种关于不确定性的直觉感受,那你大概就该坚持使用那些会利用这种直觉感受的算法,因为你内建的算法很可能比你那种笨拙地把事情塞进词语里的尝试做得更好。
不过,也可能正因为我这样推理,我自己也会变得不一致。举例来说,相比于启动大型强子对撞机,我会对一种有明确定义、且有 1/1,000,000 概率毁灭世界的彩票装置更加警惕得多。
另一方面,如果你问我:我能不能连续作出一百万次像「大型强子对撞机不会毁灭世界」这样的权威断言,并且平均大约只错一次?那我就得回答:不能。
我该拿这种不一致怎么办?我也不确定,但我肯定不会挥一挥魔杖,假装把它消掉。这就像你发现自己拥有的两张地图彼此不一致,于是赶紧在上面乱涂几笔,好让它们看起来一致。
顺便一提,相比于一种有 1/1,000,000,000 概率毁灭世界的彩票装置,我也会对一种「只要犹太—基督教的上帝存在就会毁灭世界」的装置没那么担心。但我也不会因此以为:我能接连作出十亿次彼此完全独立、且风险程度都与「上帝不存在」相当的断言,并平均只错一次。
我不能说自己对这种认知上的处境感到满意,但在我能看见自己是在朝着更高的准确性与现实世界中的有效性前进,而不只是朝着更高的自洽性前进之前,我不会去修改它。毕竟,目标就是赢。如果我编造一个并未经过概率工具塑形的概率,编造一个并非由数值方法制造出来的数字,那么也许我只是在压制那些本来会用其原生不确定性模式推理得更好的内建算法。
当然,这并不意味着你可以无视那些有坚实根据的概率。任何一点数值基础,都很可能比一种模糊的不确定性感觉更好;人类是糟糕的统计学家。但如果你是彻底凭空拍脑袋编出一个数字——也就是说,用一种非数值程序去产出一个数字——那几乎就等于毫无根基;在那种情况下,你大概还是坚持那种模糊的不确定性感觉得更好。
这就是为什么在我的写作里,我通常会用「也许」「大概」「想来」这类词,而不是给出像「40%」「70%」「95%」这样编出来的数值概率。想想看,那样看起来会多么可笑。我认为那确实会很可笑;而且我认为那样做,我会做得更差。
我不是那种声称你应该编造概率、以免自己遭受荷兰书的稻草人式贝叶斯主义者。我是这样一种贝叶斯主义者:在实践中,人类之所以会遭受荷兰书,是因为他们没有强大到足以避免它们;而且,接住球比避免荷兰书更重要。数学就像底层物理学:它不可逃避地支配着一切,但计算起来太昂贵。
而那种只会模仿数学表面形式、却不能系统性地产生更好决策的认知仪式,也毫无意义。那会是一种迷失的目的;这并不是在法则之下生活的真正技艺。